Tanya Pomodo
Semua Artikel
Teknologi
Bisnis
Sains
Finansial
Semua
entitas
SWE-BENCH LITE
SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.
Daftar
atau
Masuk
untuk mendapatkan artikel-artikel relevan yang dipersonalisasi
Teknologi
6 bulan lalu
213 dibaca
Studi Microsoft: AI Sulit Pecahkan Bug, Pemrogram Manusia Tetap Penting